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Tema 4: Análisis de datos con R 





En este tema: 

1.- Introducción a la modelización estadística. 
2.- Modelos básicos con datos normales. 

3.- Análisis de la Varianza. 

4.- Comparaciones. 

5.- ANOVA de un factor con R. 
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Sección 1 | Introducción a la Modelización Estadística 
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Introducción a la modelización estadística. 


e Los datos obtenidos cuando realizamos cualquier experimento presentan 
variabilidad y la Estadística nos permite analizar los datos que exhiben variabilidad. 


e En ese proceso podemos distinguir entre Modelización estadística; Estadística 
descriptiva, e Inferencia estadística. Gráficamente: 


Muestreo aleatorio 











POBLACIÓN > 
X = Modelo(0) XF (4, ....An) 
0 Parámetro(s) Estadística Descriptiva 


t(X) función 


de los datos 


A SSSAEÁ— A 


Estimación y Contraste de hipótesis 


desconocido(s) 


Utilizamos t(X) para explicar 0 


DENTALES NEU) Comp. y Prog. en R: Tema 4 4 /66 


Modelización en la Estadística. 


o En general, un modelo es una representación en pequeña escala de la 
realidad. 


o La Estadística nos permite incorporar la variabilidad presente en la 
vida real en nuestros modelos a través de la aleatoriedad. 


e Aun así: “esencialmente, todos los modelos son incorrectos, pero 
algunos son útiles” (Box, 1987). 


e Los modelos estadísticos son la base en la que se sustentan la mayoría 
de las técnicas de análisis de datos habituales. 


o “La formulación del problema es más esencial que su propia solución, 
que puede ser simplemente una habilidad matemática o experimental” 
(Albert Einstein). 
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Formulación de un problema. 


Para formular adecuadamente un problema: 


o Entender el background físico del problema. Los estadísticos suelen 
trabajar de manera conjunta con especialistas de diversas áreas y 
necesitan conocer lo básico del área del problema. 


o Comprender claramente el objetivo. No es una tarea fácil concretarlo. 


o Tener claro lo que quiere la persona que nos ha consultado. No tiene 
sentido hacer un análisis más complejo si su interés es menor. 


o ¡Poner el problema en términos estadísticos! Este es el paso clave en 
el que a veces se cometen errores irreparables. Pero una vez está en 
términos estadísticos, la solución suele ser rutina. 


o Pero cuidado, que tengamos un modelo que lea y procese los datos no 
es suficiente si no somos capaces de extraer conclusiones. 
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Comentarios sobre la toma de datos. 


En el proceso de modelización es crucial el entender como se han tomado o como se van 
a tomar los datos. 
e ¿Los datos son observacionales o experimentales? 


o Es decir: ¿provienen de una muestra o encuesta convencional (recogidas por mera 
observación si control sobre las condiciones) o han sido obtenidos como resultado 
de un diseño experimental (con control sobre las condiciones)? 


e Las conclusiones dependerán de que tipo son: en el primer caso podremos hablar 
de asociación entre los datos, mientras que en el segundo caso podremos hablar de 
una relación causa-efecto. 


¿Hay información o datos que no hemos observado? 
¿Hay valores faltantes? 
¿Cómo se han codificado los datos? 


¿Cuales son las unidades de medida? Redondeo. 


¿Hay errores en la entrada de datos? Conviene realizar análisis previos. 
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Modelización: tipos de variables. 


e Cuando modelizamos un problema real: 
> ¿qué queremos explicar? 
» y ¿en base a qué? 
o Esto nos clasifica las variables en: 
> Variables respuesta: las que queremos explicar 
> Variables explicativas (o independientes, o predictoras): las que nos 
sirven para explicar las variables respuesta 
o Las variables también se clasifican por su tipo de atributo: 
> Cualitativo —> Intrínsecamente no tiene carácter numérico 
(categórica) 
* Nominal (sin orden entre los valores): Sexo 
* Ordinal (con valores ordenados): Nivel de estudios 
> Cuantitativo —> Intrínsecamente numérico 


* Discreto (cantidad finita o numerable de valores): Número de hijos 
* Continuo (valores en toda la recta real): Altura 
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Modelos estadísticos. 


o La mayoría de los modelos estadísticos tienen una estructura del tipo: 
> Variable respuesta que se quiere explicar. 
> Una componente sistemática que contiene la información “general” del 
sistema bajo estudio, y que se expresa como una combinación de 
variables explicativas en forma de ecuación paramétrica. Indica pues 
como afectan las explicativas a la respuesta. 
> Una componente aleatoria que refleja la variabilidad intrínseca en cada 
situación (en cada dato) particular. 
o Dependiendo del tipo de variable, las explicativas son: 
> Cualitativo —> Factores (con sus correspondientes “niveles”) 


* Efectos fijos (si los niveles del factor están prefijados de antemano: 
Sexo) 

* Efectos aleatorios (si los niveles del factor son una muestra aleatoria de 
los posibles niveles de dicho factor: persona) 


> Cuantitativo —> Covariables 
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Modelos estadísticos paramétricos. 


o La mayoría de las veces la componente sistemática viene expresada como una 
combinación lineal (pero puede ser también no lineal). 


eo Una manera de incluir la aleatoriedad en la componente aleatoria es asignando una 
distribución de probabilidad a la variable respuesta. 


O Si la variable respuesta es normal (la mayoría de los casos) y la relación lineal nos 
encontramos ante los modelos lineales. 


o Ejemplo: explicar el peso de una persona por su altura y su edad. 
pr = Bo + gx + px) 
o Esta explicación no es tan clara si la variable es discreta o cuantitativa pero la 


observamos categorizada. 


O La variable respuesta no tiene porqué ser normal, podría ser binomial, Bernoulli, 
gamma, Poisson, etc. 


e En cualquier caso, todos los modelos siempre vienen expresados en función de 
parámetros, siendo la inferencia sobre ellos (estimación y contraste de hipótesis) 
nuestro objetivo final. 
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Revisión elementos básicos inferencia 


Estimación 
o Utilizamos la estimación puntual de un parámetro para tener una 
primera aproximación sobre su valor. 


e En la mayoría de los modelos se conoce el mejor estimador y un 
Intervalo de confianza para los parámetros de interés. 





Elementos de un contraste 
o Datos (obtenidos de forma muy diversa) 
o Hipótesis nula (Hp) 
o Hipótesis alternativa (Ha) 
o Estadístico de contraste T (y su distribución bajo Hp) 
o Valor observado del est. de contraste: t 


o P-valor: Prob. si Hp es cierta de que el valor de T sea más extremo 
que t en la dirección de la hip. alternativa 
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Revisión elementos básicos inferencia (y 2) 


Contrastes Paramétricos 
o Asumen que los datos tienen una determinada distribución 


o El contraste es sobre alguno de los parámetros de una distribución 


o Ejemplo: Test de la t de Student para una muestra 





Contrastes No Paramétricos 


o No asumen ninguna distribución para los datos 


e En principio, son más flexibles 





Entonces, ¿cuál usamos? 








o Paramétricos, si se cumplen las hipótesis sobre los datos 
o No paramétricos, en otro caso 


e OJO: ¡¡Param./No param. no contrastan exactamente lo mismo! ! 
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No olvidar de todas maneras que la primera parte del análisis de unos datos siempre 
involucra la descripción numérica y gráfica de los mismos. 


Ejemplo 






















library(foreign) 

ambiente<-read.spss(file="ambiente.sav", to.data.frame=TRUE) 
attach(ambiente) 

$ Análisis descriptivo numérico 

summary (ambiente) 

by(OZONO,OZONO,length) +tt N” de lugares clasf. por ozono 

by (SULFATO, OZONO, mean) $ Media de sulfato por grupo de ozono 
by(PH, PROVIN, summary) tt Est. resumen de PH por provincia 

+ Diagrama de cajas por factores 

boxplot (SULFATO”PROVIN) 

boxplot (PH”OZONO) 

$ Gráficos 

hist(SULFATO, main="Histograma del SULFATO") 

boxplot(PH, main="Diagrama de cajas del PH") 

HGráficos por grupos 

par (mfrow=c(2,2)) 

hist(PH, main="Histograma del PH") 

by(PH, PROVIN, function(X, xlim)fhist(X, xlim=x1lim)),xlim=range(PH)) 
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Sección 2 | Modelos básicos con datos normales 
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Modelos básicos con datos normales 


e Aunque es posible realizar análisis estadísticos y numéricos de gran complicación, 
no tiene ningún sentido el llevar a cabo un análisis más complicado del 
estrictamente necesario. 


o De acuerdo con el principio de la navaja de Occam, la elección un modelo 
estadístico debe ser siempre lo más simple posible. 


o Vamos a describir los contrastes de hipótesis más básicos que permiten resolver 
algunos de los análisis de datos más habituales que involucran una y dos muestras 
cuando los datos son normales. 


e En concreto: 


> Problemas de una muestra (interés sólo en la variable respuesta) 
* Media 


> Problemas de dos muestras (interés en la variable respuesta pero explicada 
por un único factor de dos niveles) 


* Comparación de varianzas 
* Comparación de medias: 
muestras independientes y muestras emparejadas. 
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Inferencia en problemas de una muestra 


Inferencia sobre la media de una población 


Sea X1,..., Xp una m.a. de una población N(y, 0?) 


o Si el interés es realizar inferencia sobre ¡, podemos estimarla con x. 
o Además cuando gd? es desconocida, podemos hacer un contraste sobre 


Ho: p< po 


del tipo 
di ñ Ha: p> Ho 


utilizando como regla de decisión: 


“Rechazar Ho si ts = TY >= 0 


o bien obteniendo su correspondiente p-valor. 


o Si 0? es conocida podemos contrastar dicho contraste rechazando si 
a Z1i-a, o utilizando su correspondiente p-valor. 
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Contraste unilateral de una media 


Inferencia sobre la media de una población 










Sea X1,..., Xp una m.a. de una población N(y, 0?) 


Ho : > 

0 pm po a 
Ha: p< po 
desconocida, podemos utilizar la regla: 


“Rechazar Ho si ts = TJ < taln— 1)", 


o Análogamente para el contraste 





o el correspondiente p-valor. 


o Si 0? es conocida se rechaza si a < Za, o bien se utiliza el p-valor. 
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Contraste bilateral de una media 


Contrastes sobre la media de una población 


Sea X1,..., Xp una m.a. de una población N(y, 0”) 
o Para el contraste bilateral o con a? desconocida, la 
Ha: pH no 


regla de decisión es: 
AReciaza si LS A 


o bien utilizar el p-valor. 





e 20 : ¡ X—p0 2 X—=H0 . 
e Si gd” es conocida se rechaza si ES Luj2 Ó UR L1—a/2, 0 bien 
se utiliza el p-valor. 
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Utilizando R para resolver contrastes de una media 


Test paramétrico 







El comando t.test nos permite realizar inferencia sobre los contrastes 
anteriores 

t.test(x, y = NULL, alternative = c("two.sided", "less", 
"greater"), mu = 0, paired = FALSE, var.equal = FALSE, 
conf .level = 0.95, ...) 








Ejemplo 
t.test(PH, mu=4) + La media de PH distinta de 4? 
t.test(SULFATO, alternative="less") + La media de SULFATO 
es menor que 0? 

t.test(SULFATO, mu=4, alternative="greater") tt La media de 
SULFATO es mayor que 4? 
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Análisis no param. de una muestra: Test de Wilcoxon 


Descripción 
e Contraste sobre la centralidad de una población (mediana) 


o Observaciones independientes: X¿,..., Xp 


o Distribución simétrica de la población 





Contraste 


o Ho: Mediana = uo 
o HA: Mediana % o 





Ejemplo 
x<=c (9, 1078,2,8,3, 0,10, 15,9) 
wilcox.test(x, mu=5) +*¿Es la mediana 57? 
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Ejemplo 
En un estudio del crecimiento de plantas, un fisiólogo plantó 13 plantas de 
soja y les midió la altura al cabo de 16 días con la intención de comprobar 
si el crecimiento medio era superior a 20 cm. 

Si los resultados fueron: 

202.229. 223.020.194. 22.22.1022. 21.9. 215, 197 21:50. 2069: 

¿qué podemos concluir al respecto? 
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Inferencia en problemas de dos muestras 


Contrastes sobre la varianza de dos poblaciones 







Sea X11,..., Xin, una m.a. de N(1, 07) y Xa1,..., Xan, una m.a. de N(¡ua, 05) 


2 2 
Ho. 01i=% 


> 2 la regla de decisión es: 
Ha o 03 + 0) 


o Para el contraste bilateral Í 


Sl 


¡Rechazar Ho stes == A ln O E ES al 


o bien utilizar el p-valor. 


Ho: 0í<o%z E 
2 se rechaza si 


o Si el contraste es unilateral > 
Ha: 01>0 


2 
A > Fi-a(m —1,nm-— 1) o utilizando el p-valor. Análogamente con el otro 
2 


contraste unilateral. 









Comando var.test de R 


var.test(respuesta ” factor) 
var.test(x, y, ratio = 1, alternative = c("two.sided", "less", 
"sreater"), conf.level = 0.95, ...) 
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Ejemplo 

Un horticultor desea evaluar un nuevo insecticida que, según la publicidad, 
reduce los daños causados por los insectos. Con esta finalidad, realiza el 
siguiente experimento con 57 de los árboles de su huerto: trata 22 con el 
nuevo insecticida y los otros 35 con el antiguo. De los datos de la cosecha 
(en kilos) de estos árboles se obtuvieron los siguientes estadísticos: 





[ue Y Antiguo 


Media 249 233 
Desviación estándar 39 45 





Como paso previo para conocer si realmente es mejor el nuevo insecticida, 
se necesita comprobar si las varianzas de los dos grupos son o no son 
iguales. ¿Qué podemos concluir? 
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Comparación de las medias de dos muestras independientes 


Contrastes sobre la media de dos poblaciones 
Sea X11,..., Xin, una m.a. de N(1, 07) y X21,..., Xon, una m.a. de N(u, 05) 


e Si las varianzas son iguales y desconocidas, para el contraste bilateral 


Ho: 1 = pa 
Ha: pu pa 


“Rechazar Ho si ts > tio /2(M + n2—2) Ó ts < toj2(m + m2 —2)", 


la regla de decisión es: 


xo E (m—1)si+(n2—1)5 
S SEE y Sp ni +n22 
PV mon 
común. Alternativamente se puede utilizar el p-valor. 


donde ts; = es la estimación de la Varianza 





Ho: p< pa 
Ha:  p1 > pa 
contraste ts > ti_a(m + m — 2) (análogamente con el otro contraste unilateral). 
Alternativamente se puede utilizar el p-valor. 


e Si el contraste es unilateral, se rechaza Ho si el estadístico del 
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Utilizando R para realizar tests t 


Comando t.test de R 


El comando anterior t.test se utiliza ahora dando valor a y 
t.test(x, y = NULL, alternative = c("two.sided", "less", 
"greater"), mu = 0, paired = FALSE, var.equal = FALSE, 
conf .level = 0.95, ...) 


pero se puede utilizar también 
t.test(respuesta ” factor) 





Ejemplo 
x < c(0.80.0.83,1.89,1.04,1.45,1.38, 1.91. 1.614.0./13.1.46) 
SS ct. 15)0.88,0090:0: 14. 1:21) 

var.test(x,y); t.test(x, y, alternative="greater") 
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Comparación de 2 medias no param.: Test Mann-Whitney 


Descripción 
o Comparamos si dos poblaciones tienen la misma mediana 


O a 


o Muestras: X1 = ( a 












Contraste 
o Ho: Mediana; = Mediana» 
o HA: Mediana; 4 Mediana» 





Ejemplo 
sc (0, 8050083, 1.89) 1. 04:1.45,123871.91,1.64,0/3, 1046) 
a AS OO ido) 

wilcox.test(x, y) * opcional, alternative = "greater" 
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Ejemplo 

Un horticultor desea evaluar un nuevo insecticida que, según la publicidad, 
reduce los daños causados por los insectos. Con esta finalidad, realiza el 
siguiente experimento con 57 de los árboles de su huerto: trata 22 con el 
nuevo insecticida y los otros 35 con el antiguo. De los datos de la cosecha 
(en kilos) de estos árboles se obtuvieron los siguientes estadísticos: 





Nuevo | Antiguo 





Media 249 233 
Desviación estándar 39 45 














¿Es realmente mejor el nuevo insecticida? 
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Comparación no paramétrica de dos muestras emparejadas 


Contrastes sobre la media de dos poblaciones 









Sea X1,..., X, una m.a. de N(1,0Í) e Yi, ..., Y, una m.a. de N(pa, 05) 


o Los datos vienen dados como pares (X,, Y1),..., (Xn, Y) porque entre ellos existe 
una relación de dependencia. Si definimos D = X — Y, tendremos una nueva 
muestra formada por las diferencias que tendrá su media (d) y desviación estándar 


(sg). 


í Ho : = 
o Así, para resolver el contraste ( 0 pi = uo 


Ha: 14 pa 
Ho: pa=0 y E 
cuya resolución es similar a la de los contrastes de una muestra 
Has 0 
(análogamente también los unilaterales). 


utilizaremos el contraste 










t.test tiene una opción para muestras emparejadas 


clio USO 162 2 ds 00. 1009. 159 9 06 130) 
y <- c(0.878,0.647,0.598,2.05,1.06,1.29,1.06,3.14,1.29) 
t.test(x, y, paired=TRUE, alternative="greater") 
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Comparación de las medias de dos muestras emparejadas 


Versión no paramétrica : Test de los signos 

o Comparamos si dos poblaciones tienen la misma distribución 

e Utilizamos el Test de Wilcoxon para una muestra con y = X] — X2 y 
po =0 





Contraste 


o Ho: Mediana, = 0 
o Ha: Mediana, 4 0 





Ejemplo 
wilcox.test(x, y, paired = TRUE, alternative = "greater") | 
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Un proceso habitual en las industrias conserveras consiste en tratar las verduras 
con agua hirviendo antes de enlatar las mismas. El problema radica en la gran 
pérdida de vitaminas que sufren las verduras así tratadas. Se piensa que un 
método consistente en un lavado previo de las verduras con vapor de agua puede 
evitar la pérdida de vitaminas. Para comparar los dos métodos, se analizaron 10 
grupos de judías provenientes de granjas diferentes. La mitad de las judías de un 
grupo se trataron con agua hirviendo y la otra mitad con vapor de agua. Se midió 
el contenido vitamínico de cada una de las mitades después del lavado, y se 
obtuvieron los siguientes resultados: 





Grupo | 1 A SA ES SA MEA E (ds 
Vapor [35 [46-65 1"53 ["6L. [54-49-57 [58-05 
Agua |33|40|55 41 |62|54 | 40 |35 | 59 | 56 
































¿Se puede decir que realmente el método lavado con vapor de agua da mejores 
resultados que el del agua hirviendo? 
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Sección 3 | Análisis de la Varianza 
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Motivación: Comparaciones entre grupos 







Muchos estudios aplicados se basan en la idea de comparar la media de varios grupos: 
unos que han recibido diferentes tratamientos y otro que no (y que recibe el nombre de 
control). Observar que tenemos una situación similar a la comparativa de la media de 
dos grupos (que resolvíamos con un test t), salvo que ahora tenemos más de dos grupos. 


Ejemplos 


Se pretende valorar la emisión de un cierto contaminante de 5 vehículos distintos, en 
concreto si el valor medio es similar en los cinco vehículos. Los datos siguientes son una 
parte de los obtenidos: 





Nissan Fiat Volkswagen Jeep Land Rover 
159.7 179.6 167.4 173.5 172.3 
161.5 173.9 163.0 182.4 168.9 


Un agricultor posee tres campos en los que quiere comprobar el comportamiento de tres 
sistemas de regadío. Para ello, divide cada campo en tres zonas en cada una de las 
cuales aplica cada sistema. En el cuadro siguiente aparecen las cantidades (en kilos) 
recogidas en varios árboles clasificadas por campo y sistema utilizado: 




















Sistema A Sistema B Sistema C 
Campo 1 41, 37, 46, 32, 39, 40 51, 43, 53, 37, 56, 53 27,29, 33, 17, 23, 28 
Campo 2 28, 37, 42, 29, 35, 23 39, 43, 48, 51, 53, 47 19, 23, 28, 23, 31, 18 
Campo 3 47, 56, 51, 43, 46, 44 49, 53, 51, 60, 52, 49 31, 33, 29, 27, 26, 32 
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Análisis de la Varianza: ANOVA. 


o Una variable respuesta se puede modelizada en función de un conjunto de variables 
explicativas continuas o discretas. 


Oo La situación más básica es la que sólo tenemos una variable explicativa (o factor 
de clasificación). 


o Nuestro objetivo será pues valorar si existen diferencias en los valores de la variable 
respuesta en las diferentes categorías del factor de clasificación. 


e El factor puede ser de: 


» Efectos fijos: cuando estemos interesados en las diferencias entre los grupos 
definidos por los niveles del factor. Nos interesa el efecto de cada tratamiento 
concreto en comparación con los otros. 

» Efectos aleatorios: No estamos interesados en las diferencias concretas entre 
los grupos definidos por los niveles del factor, es decir, no nos interesa el 
efecto de cada tratamiento concreto en comparación con los otros. Nos 
interesa la variabilidad entre grupos. Los diferentes niveles del factor, se 
consideran como una muestra aleatoria de todos los niveles que el 
investigador podría seleccionar. 


e Diremos que el modelo (o el diseño) es equilibrado cuando el número de 
observaciones por nivel del factor sea el mismo. 
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ANOVA de un factor de efectos fijos 










A O 
IE Ss 


Comp. Sist. Comp. Aleat. 


o DO o =0 para evitar la sobreparametrización. Equivalente a Y¡¡ = uj + Ej. 
O y representa la media global de la población 
o a; es la desviación de la media del grupo ¡ de la media global 


o sj: desviación del individuo ¡ de la media del grupo ¡; ej; - N(O, 0?) independientes 










ANOVA de un factor de efectos aleatorios 


Yi =u4RA + Ej |.) IL... J=L... 
To y 
Comp. Sist. Comp. Aleat. 
o A; N(0,0%) 
O y representa la media global de la población 


o A, es el efecto aleatorio debido a ser del grupo ¡ 


o sj: desviación del individuo ¡ de la media del grupo ¡; ej; - N(O, 0?) independientes 
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Descomposición suma de cuadrados y Tabla ANOVA 















e Si denotamos con y,. a la media de cada grupo, y con y.. a la media global de 


O y Ny; 


todos los datos (= Hi— = %%— con N = ) >, n;), podemos descomponer 
cada dato de la siguiente manera: 





O A A 
o Elevando al cuadrado y sumando para todos los valores de ¡ y de j: 


ya Nu 7. =>), Nu A Y, -- 


fl ¿Sl í=L ¿SL í=L [Sl 











SS Total SS Intra o Error SS Entre 


e En forma de Tabla de ANOVA (Análisis de la Varianza): 
F. Variación 55 gl MS 





Entre DNA ea a—=1 MS Entre = SS Entre/(a-1) 
Error DS pe e Ve N—a MS Error = SS Error/(N-a) 





ID SA > N—1 


o ¡Las sumas de cuadrados se reescriben para que los cálculos sean más cómodos! 
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Inferencia sobre los parámetros 


ANOVA de un factor de efectos fijos 


o Estimación parámetros (por máxima verosimilitud): 

















9 1 =y. 
Q a =VYo Vo 
O 5*= MS Error 
e Contraste de hipótesis: el cociente F¿ = e == es el estadístico de 
contraste de 
Ho 2 pa po coc Pa En Ho (Es Q0 000 Qa 0 
Ha : no Hb A no Ho 


y su distribución en el muestreo bajo Ho es una F(a—1,N— a). 


e Observar que si a = 2 el contraste resultante equivale a una comparación de 
dos muestras independientes. Se puede demostrar que ambos estadísticos de 
contraste (el F; y el Ts) están relacionados (en concreto: F¿ = T2), y por 

tanto llegan a la misma conclusión. 
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Inferencia sobre los parámetros (2) 


ANOVA de un factor de efectos aleatorios 
o Estimación parámetros (por máxima verosimilitud): 
O f=y. 
O 5? = MS Error 
Qs 












a en (si esta cantidad es menor que 0, 6% = 0) con: 


2 a 
20 ME=D) 1) (a A n;). 
Si el diseño es equilibrado, no = n; = n. 


o Contraste de hipótesis: el cociente Fs = IO es el estadístico de 
contraste de 
a On = 0 
O 


y su distribución en el muestreo bajo Hg es una F(a— 1,N— a). 


o Así pues, mismo estadístico de contraste pero diferentes hipótesis, ya 
que el modelo es diferente y las conclusiones también son diferentes. 
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Validez del modelo: condiciones de aplicabilidad 


o La inferencia en ambos casos está basada en tres condiciones que 
vienen determinadas por los propios modelos. 
o ej  N(0, 0”) independientes 
> Homocesdasticidad. misma varianza en los grupos analizados 
> Normalidad: de los datos de cada grupo 
> Independencia: tanto de las muestras entre sí como de las 
observaciones en cada grupo 
o Tenemos dos opciones para comprobar estas condiciones: 
> Antes del ANOVA, utilizar tests de homogeneidad de varianzas 
(Bartlett, Fligner-Killeen o Levene), tests de normalidad 
(Kolmogorov-Smirnov o Shapiro-Wilks) y tests de independencia 
(rachas), tal y como hacíamos en la comparación de dos medias 
> Después del ANOVA, analizar los residuos resultantes del ajuste, tal y 
como hacíamos en regresión 
e Si no se cumplen las condiciones: 
> podemos transformar los datos (p. e. utilizando Box-Cox) 
» utilizar un método no paramétrico: el test de Kruskal-Wallis, una 
generalización del test de Mann-Whitney 
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Tarea 


Los siguientes datos provienen de un experimento realizado en la estación experimental 
de Rothamsted. El objetivo era medir la eficacia de tres insecticidas, el 
clorodinitrobenceno (CN), el carbón disulfido (CD) y un preparado propio denominado 
cymag (CM). Cada insecticida se aplicó a dosis normal (1) y doble (2). Por último se 
contó con un grupo control al que no se aplicó ningún insecticida. Los pesticidas se 
aplicaron antes de la siembra del trigo, y los datos recogidos muestran el incremento del 
número de gusanos encontrados en cada parcela después de la recolección del trigo. 





Insecticida 
Control | 1ICN | 1ICD | 1ICM | 2CN | 2CD | 2CM 
466 222 194 306 92 166 28 
421 219 221 176 114 7 179 
561 5% 308 215 80 111 165 

433 298 256 199 128 80 82 





























O) Especifica un modelo estadístico adecuado para analizar este experimento y explica 
el significado de sus parámetros. 
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Tarea 


Q Comenta las hipótesis de aplicabilidad que deberían cumplirse para 
poder analizar estos datos con la técnica especificada en el apartado 
anterior. 


Q ¿Existen diferencias estadísticamente significativas en el incremento 
de gusanos dependiendo del insecticida aplicado? En otras palabras, 
¿hay efecto insecticida? Plantea y resuelve el contraste adecuado. 
Ayuda: comprueba para ello que con esos datos se obtiene la siguiente 





tabla ANOVA: 
Fuentes de variación SS gl MS | F 
Insecticida 392447 6 65408 | 22.473 
Residual 61121 21 2911 





Q ¿Cual es el alcance de las conclusiones que te aporta el contraste que 
has realizado? 
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Sección 4 | Comparaciones 
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Comparaciones a posteriori 


o Cuando se rechaza la hipótesis nula en un contraste en el que el 
interés es las diferencias entre grupos (efectos fijos), la conclusión es 
que al menos uno de los grupos tiene la media diferente, es decir, que 
hay un efecto de ese factor que estamos analizando. 





o Pero no nos aclara ni que grupo es el que tiene la media diferente ni 
si es uno sólo. 

o Una posibilidad para mejorar las conclusiones es utilizar 
comparaciones dos a dos de las medias de los grupos y en algunas de 
ellas hay que tener presente la protección del error global: 

> Método de Tukey 
> Método basado en las diferencias significativas utilizando la corrección 


de Bonferroni, 
> y otros muchos más (Scheffé, Student-Newman-Keuls, Dunn-Sidak, 


etc.) 
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Comparaciones a posteriori: caso particular diseño equilibrado (n 
tamaño grupo) 













(O Cálculo y ordenación de las medias de los grupos. 


Q Cálculo de las diferencias dos a dos de las medias ordenadas y construcción de una 
tabla de diferencias de medias. 


Q Obtención de las diferencias significativas (en base a cualquiera de los métodos) 
como aquellas que superan los valores: 


Método Bonferroni. Si a” es el error global máximo a cometer: 


z 
ESPA= AN)  MSError 


ta y 6 
con 4 = E siendo k el número de comparaciones dos a dos. 


k 
MSError 
MSRo = Qo,(a,N—8)Y/ 27 


Método Tukey: 
con Qu. (a,m—a) Valor crítico en la tabla de rangos estudentizados. 


Q Obtención de subgrupos homogéneos: aquellos subgrupos con medias similares. 
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Tarea 


(O Obtener los grupos homogéneos resultantes de aplicar el método de Tukey con los 
datos de los insecticidas. ¿De qué manera observas que se amplian las conclusiones 
que puedes aportar sobre el problema planteado? 


Q Para controlar el posible impacto medioambiental que supondría el incendio de 
varias fábricas de tejidos próximas a un bosque, se determinó el tiempo (en 
segundos) que tardaban en arder 5 vestidos, elegidos al azar, realizados en cada 
una de ellas. Del análisis de los datos se obtuvieron los siguientes resultados: 





Fábrica 1 2 3 4 5 





Media 16.78 | 11.76 10.24 | 11.98 | 15.26 
Desv. Típica | 1.167 | 2.3298 | 1.1437 | 1.862 | 0.9182 














O Si medimos la peligrosidad de una fábrica por el tiempo que tardan en arder 
sus vestidos, ¿hay evidencia para pensar que los tejidos de las fábricas 
influyen en su peligrosidad? 

O Calcula los subgrupos homogéneos resultantes de aplicar tanto el método de 
la diferencia significativa con la corrección de Bonferroni como el método de 
Tukey. ¿Qué conclusiones puedes extraer de estos grupos homogéneos? 

¿Cuáles son tus conclusiones globales sobre el análisis realizado? 
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Comparaciones previamente planificadas (o a priori) 


o Existe otra posibilidad de completar la información que nos aporta un contraste de 
ANOVA de un factor de efectos fijos. 


e Consiste en resolver contrastes que previamente son de interés (a diferencia de las 
comparaciones a posteriori donde no había un interés planificado, si no que eran 
los propios datos los que nos aportaban los grupos homogéneos). 


e Existen dos posibilidades: 


> Comparar k de los a grupos 
> Comparar una combinación lineal de las medias (contrastes de medias) 


Comparación de k de las a medias: procedimiento 








Para contrastar 














Ho : pu) 42) 600 Pr) Ne Ho á Q(1) Q(2) 650 Q(k) 0 
Ha A no Ho a Ha ñ no Ho 


MS Entre k grupos 
MS Error 





utilizamos el estadístico de contraste F, = que se distribuye bajo Ho como 


Di 
k—1 





una F(k— 1, N — a) siendo MS Entre k grupos = E 
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Contrastes de medias: procedimiento 










(O Determinar el contraste de medias que se quiere realizar. Puede ser cualquier 
comparación a priori del tipo: 


Ho : o E Ho : O 


Ha: no Ho EA no Ho 


que cumpla que los coeficientes ) ,,c; =0. 
QA Calcular el estadístico de contraste 


__ SS Entre 


as MS Error 


que se distribuye bajo Ho como una F(1, N — a) siendo 


a de 


2 
(85 
E i 


¡=L nj; 


SS Entre = 








Q Rechazar la hipótesis nula de acuerdo al p-valor asociado al estadístico anterior. 
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Contrastes de medias: ortogonalidad 


e Dos contrastes de medias 


Ho : e CiU; = 0 


Ha , no Ho 


son ortogonales cuando >; 


cid; 
¡ll n; 


by 


e 


Ho : 
Has 


Dj=1 dj =0 


no Ho 


e Cuando dos contrastes de medias son ortogonales, las dos comparaciones 
son independientes y aportan información complementaria. 


e Es posible descomponer una comparación de a grupos en a— 1 contrastes de 


medias ortogonales entre sí (cada uno con un grado de libertad). 


e Las comparaciones de k de las a medias también se pueden descomponer en 


k — 1 contrastes de medias ortogonales entre sí. 


e Además, la SS Entre de la comparación de a grupos también se puede 





descomponer como la SS Entre de cada contraste de medias. 
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Tarea 


47 / 66 


En un estudio sobre el comportamiento de un parásito, se visitaron cinco zonas de 
interés situadas en la Comunitat Valenciana (Alcublas, Jarafuel, Jalance, Enguera y el 
Saler; las cuatro primeras localizadas en el interior de la provincia de Valencia y la 
última en la costa). En cada una de las zonas se analizaron varios parásitos. En concreto 
se estudió su peso (en gramos), siendo el objetivo comprobar si existían diferencias en el 
peso en las diferentes zonas consideradas. 




















Alcublas Jarafuel Jalance Enguera el Saler 
Media 2.40 2.37 2.45 2.07 1.47 
Varianza 0.48 0.39 0.21 0.32 0.46 
Tamaño muestral 200 200 200 200 200 





el significado de sus parámetros. 


las cinco zonas analizadas? 
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Especifica un modelo estadístico adecuado para analizar este experimento y explica 


Valora las hipótesis de aplicabilidad que deberían cumplirse para poder analizar 
estos datos con la técnica especificada en el apartado anterior. 


¿Existen diferencias estadísticamente significativas en el peso de los parásitos en 


¿Como analizarías la hipótesis de que en la zona costera el peso difiere de la zonas 
más interiores? ¿Puedes hacerlo con los datos disponibles? 


48 / 66 


Sección 5| ANOVA de un factor con R 
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ANOVA de un factor con R 


El objetivo de esta sección es trabajar la resolución de los problemas de 
ANOVA de un factor utilizando R. 


e Aunque podemos utilizar el comando 1m (R toma como referencia un 
nivel del factor y utiliza variables dummy para el resto de niveles del 
factor), 


e habitualmente se utiliza el comando aov. 


Algunos elementos importantes 







La función summary sobre un objeto tipo aov produce la tabla de ANOVA 
necesaria para realizar el contraste de comparación de las medias. 


fitted.values: Valores ajustados, y; 
residuals: Valores de los residuos (no tipificados) 


Con el comando rstandard accedemos a los residuos estandarizados. 
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Validación del ajuste realizado 


eo Podemos realizar la comprobación de las condiciones de aplicabilidad antes 
de realizar el ANOVA: 


O Homocesdasticidad: para comprobar si las varianzas son homogéneas 
podemos utilizar el test de Bartlett (bartlett.test()), el de Fligner-Killeen 
(fligner.test()) o el de Levene (leveneTest () de la librería car). 

Q Normalidad: para comprobarla podemos utilizar el test de Kolmogorov 
Smirnov (ks.test(Q) o el de Shapiro Wilk (shapiro.test (O). 

Q Indepedencia: comprobando si existen rachas (grupos de valores 
ininterrumpidos en la misma dirección) podemos valorar la independencia de 
los datos. 


e Como en regresión con el comando plot (objetoaov) tenemos cuatro 
gráficas que nos permiten validar la adecuación del modelo. 


e Si no tenemos condiciones de aplicabilidad podemos transformar los datos 
(la mejor transformación nos la da la función boxcox) o utilizar el test de 
Kruskal Wallis (kruskal .test) que contrasta la hipótesis: 


Ho: Mediana; = ...= Mediana» 
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Comparaciones a priori: contrastes de medias 


e Si tenemos un contraste de medias: 


Ho: c141 + 0OpM9+... + Calla =0 _ Ho: a e 
Ha : no Ho O a no Ho 


con > ,c; = 0, podemos resolverlo utilizando R utilizando el hecho de 
que las variables de tipo factor tienen entre sus propiedades los 
contrastes en que descomponer su efecto. 

Por defecto, contrasta si la media de cada nivel coincide con la media 
del nivel de referencia. 


o Para ello utilizamos el comando contrasts() construyendo la matriz 
que define los contrastes, y luego asociándola al factor. 
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Comparaciones a priori: contrastes de medias 
Por ejemplo, si queremos contrastar si el grupo 1 es similar al resto de cuatro grupos: 


m.contrs + matrix(c(-4,rep(1,4)),nco1l=1) 

contrasts(factor) — m.contrs 

ajuste.contrs + aov(var.respuesta = factor) 

summary.aovl(ajuste.contrs, 
split=list(factor=1list("G1.vs.resto"=1))) 


Observar que la instrucción summary.aov() actuando sobre el objeto resultante de un 
ajuste mediante aov() produce una tabla con la valoración de los efectos del factor que, 


al corresponder con los contrastes que le hemos asociado, responden a las preguntas 
formuladas. 


Si quisiéramos contrastar además que el segundo grupo es similar al tercero y al cuarto: 


m.contrs + matrix(c(-4,rep(1,4),c(0,-2,1,1,0)),nco1=2) 

contrasts(factor) — m.contrs 

ajuste.contrs + aov(var.respuesta “ factor) 

summary.aovl(ajuste.contrs, 
split=list(factor=1list("G1.vs.resto"=1,"G2.vs.G3yG4"=2))) 
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Comparaciones a posteriori 


Para resolver comparaciones a posteriori utilizando R podemos utilizar las 
funciones: 


o TukeyHSD, que nos da la diferencia entre todas las medias dos a dos, 
y un intervalo de confianza para dicha diferencia junto a un p-valor ya 
ajustado que nos indica si dicha diferencia es significativa. Á partir de 
esta información es muy sencillo construir los subgrupos homogéneos 


como aquellos que contienen grupos con medias cuya diferencia no 
sea significativa. 


o LSD.test, SNK.test, scheffe.test son tres funciones de la 
librería agricolae que nos indican los subgrupos homogéneos 
resultantes de aplicar dichos métodos, junto con las cotas a partir de 
las cuales las diferencias son significativas. 
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¿Cambia la longitud de la sección de un guisante con la adición de azúcares? 


Situación 

Los siguientes datos provienen del ejemplo expuesto en el libro de Sokal y Rohlf 
(Biometría: principios y métodos estadísticos en la investigación biológica) y hace 
referencia a un estudio sobre la longitud de secciones de guisantes (en unidades oculares 
de 0.114 mm.) criados en cultivos con adición de distintos azúcares. 





control glucosa fructosa  gluc+fruct sacarosa 


715 57 58 58 62 
67 58 61 59 66 
70 60 56 58 65 
15 59 58 61 63 
65 62 57 57 64 
71 60 56 56 62 
67 60 61 58 65 
67 57 60 57 65 
76 59 57 57 62 
68 61 58 59 67 








Describe el diseño que consideres más adecuado para valorar si hay cambios en la 
sección dependiendo del tipo de azúcar administrado. 
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Lectura y descriptiva: Código R 


setwd("=/Documentos/Docencia/Bancos-Datos") 

guis — read.table(file=”"guisantes.dat”?, header=T) 

attach(guis) 

by (longitud , tratamiento , summary) 

by (longitud ,tratamiento,var) 

boxplot(longitud-tratamiento ,boxwex=0.75, 
ylim=c(50,80),xlim=c(0.5,7),co1=4) 

boxplot(longitud, add = TRUE, boxwex=1.5,at=6.5,co01=2) 

texto. az. total) 





Salidas R 
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Validación condiciones aplicabilidad antes: Código R 


bartlett.test(longitud -— tratamiento) 
fligner.test(longitud = tratamiento) 

Tibrary (“car”) 

leveneTest(longitud — tratamiento) 

by (longitud, tratamiento ,shapiro.test) 
runs.test(as.factor(longitud > median(longitud))) 





Salidas R 


Bartlett*sK-squared=13.9386,df=4,p-value=0.007494 
Fligner-Killeen:medchi-squared=10.2645,df=4,p-value=0.0362 
Levene-p-value=0.003468x*x* 


fShapiro-Wilks-->normalidad 
RunsTest 


data:as.factor(longitud>median(longitud)) 
StandardNormal=-1.9258 ,p-value=0.0002032 
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Validación condiciones aplicabilidad después: Código R 


guis.aov — aoví(longitud =— tratamiento) 
summary (guis.aov) 
model.tables(guis.aov,type="means") 
model.tables(guis.aov,type="effects") 


+ Tabla ANOVA 

Df Sum Sq Mean Sq F value Pr (>F) 
tratamiento 4 1077.3 269.33 49.37 6.74e-16 *x*x* 
Residuals 45 245.5 5.46 


Table of means: Grand mean 61.94 
Table of means: tratamiento 


control fructosa gluc.fruct glucosa sacarosa 
Os OZ 850 BS 64.1 


Tables of effects tratamiento 
control fructosa gluc.fruct glucosa sacarosa 
So -3.74 -3.94 -2.64 2.16 
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Validación condiciones aplicabilidad después: Código R 
par(mítron=c (2, 2))% 


plot(guis.aov) 


plot(guis.aovfmodel$ftratamiento,guis.aovfresiduals) 
plot(1:50,guis.aovfresiduals ,pch=20) 
medias + tapply(longitud, tratamiento, mean) 
dts — tapply (longitud ,tratamiento,sd) 
plot(medias,dts) 
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Factor Level Combinations 


5 
tratamiento a : " 
control * fructosa gluc.fruct glucosa sacarosa 
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Test no paramétrico y transformaciones: Código R 


guis.ks — kruskal.test(longitud,tratamiento) 
guis.ks 

%+Kruskal-Wallis chi-squared=38.4368, df=4, p-value=9.105e-08 
% transformaciones 

library (MASS) 

bc  boxcox(guis.aov,lambda=seq(-6,0,length=20)) 

lambda — bc$x[which.max(bc$y)] 

lambda 


* LINO =3. 575158 
trans tone itude tons itud (23) 


%*tras transformar las condiciones aplicabilidad se cumplen 
bartlett.test(trans.longitud, tratamiento) 
by(trans.longitud, tratamiento, shapiro.test) 
guis.trans.aoviaovítrans.longitud-tratamiento) 

summary (guis.trans.aov) 
model.tables(guis.trans.aov,type="means") 
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Los biólogos que diseñaron el experimento estaban interesados en el efecto de los 
distintos azúcares en el tamaño de los guisantes. Las preguntas más interesantes, 
formuladas en términos de comparaciones de grupos (a través de sus medias) eran: 


O ¿Influye cualquiera de los tipos de azúcar?, es decir, ¿difiere el grupo de control 
(sin azúcar) del resto de grupos reunidos como si fueran uno sólo? 


(O ¿Existen diferencias entre la sacarosa y los otros dos tipos de azúcar? 
Q ¿Hay diferencia entre utilizar glucosa o fructosa puras y o ambas combinadas? 
Q ¿Difieren los grupos tratados con glucosa y fructosa? 


Comparaciones a priori: Código R 


contrastes < -matrix(c(1,rep(-1/4,4), 
AS O al 
O 
00 == 021200), nco01=4) 
contrasts(tratamiento) + contrastes 
guis.contrastes + aov(trans.longitud-tratamiento) 
summary.aov(guis.contrastes, 
split=list(tratamiento=1list("Ctr.vs.azucs."=1, 
"Sac.vs.restoazucs."=2, 
"G1.yFr.vs.ambascombs."=3, 
"Gl. .verr "= 140) 
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Comparaciones a posteriori: Código R 


ajuste.tukey — TukeyHSD(guis.trans.aov ,ordered=T) 
ajuste.tukey 
plot(ajuste.tukey) 





Salidas R 


95% family-wise confidence level 


























fructosa-sacarosa  fructosa-control 




















gluc.fruct-fructosa 


T j T T T T T 
-5.0e-07 0.0e+00 5.0e-07 1.0e-06 1.5e-06 2.0e-06 2.5e-06 


Differences in mean levels of tratamiento 
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Comparaciones a posteriori: Código R 


library("agricolae") 
ajuste.LSD — LSD.test(guis.trans.aov,"tratamiento", 
p.adj="bonferroni") 


ajuste.LSD 





Salidas R 


$parameters 
Df ntr bonferroni 
45 5 2. 3520T79 


$groups 

trt means M 
1 gluc.fruct 5.141309e-06 a 
2 fructosa 5.100475e-06 a 
3 glucosa 4.815334e-06 a 
4 sacarosa 3.812881e-06 b 
Bb control 2.95245b1e-06 c 
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Comparaciones a posteriori: Código R 


ajuste.SNK + SNK.test(guis.trans.aov,"tratamiento") 
ajuste.SNK 

ajuste.Scheffe — scheffe.test(guis.trans.aov,"tratamiento") 
ajuste.Scheffe 





Salidas R 
$groups 

trt means M 
1 gluc.fruct 5.141309e-06 a 
2 fructosa 5.100475e-06 a 
3 glucosa 4.815334e-06 a 
4 sacarosa 3.812881e-06 b 
Bb control 2.95245b1e-06 c 
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Tarea: continuación problema incremento gusanos 


(O Contrasta la posible igualdad de medias en el número de gusanos que proliferaron 
con los diferentes tratamientos, planteando el contraste de hipótesis adecuado. 


Q Ala vista del resultado obtenido, contrasta las posibles diferencias entre todos los 
grupos utilizando el método de Bonferroni y de Tukey. Construye los subgrupos 
homogéneos y comenta los resultados obtenidos. 


O Completa tus conclusiones considerando las siguientes comparaciones: 


Una comparación entre el grupo control y los insecticidas 

- Una comparación entre los insecticidas a dosis 1 y los insecticidas a dosis 2 
Una comparación entre los insecticidas a dosis 1 

- Una comparación entre los insecticidas a dosis 2 


Para cada una de estas comparaciones: 


Descompón en contrastes ortogonales las comparaciones con más de 1 grado 
de libertad. 

¿Qué parejas de contrastes resultan ser ortogonales entre sí? 

Resuelve los contrastes y comenta los resultados. 


Q Valora las condiciones de aplicabilidad en este problema, y caso de que no se 
cumplieran, propón una transformación adecuada y valora entonces si existe el 
efecto que antes has estudiado. 
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Licencia de este material 


Más info: http: //creativecommons.org/licenses/by-sa/3.0/es/ 


Usted es libre de: 


copiar, distribuir y comunicar públicamente la obra 
hacer obras derivadas 


Bajo las condiciones siguientes: 











Reconocimiento. Debe reconocer los créditos de la obra de la ma- 
nera especificada por el autor o el licenciador (pero no de una 
manera que sugiera que tiene su apoyo o apoyan el uso que hace 


(5) 
de su obra). 
O) 








Compartir bajo la misma licencia. Si transforma o modifica esta 
obra para crear una obra derivada, sólo puede distribuir la obra 
resultante bajo la misma licencia, una similar o una compatible. 
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